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Priifungsantrag gem. § 44 PatG ist gestellt 

(g) Spracherkennungspegelsteuervorrichtung in einem Spracherkennungstelefongerat und zugehoriges 
Steuerverfahren 

© Eine Vorrichtung fur das Steuern des Spracherken- 
nungspegefs eines Spracherkennungstelefongerates in 
Abhangigkeit vom Umgebungslarm umfa&t einen Ton- 
speicher fur das Aufzeichnen von Sprachbefehlen, einen 
Larmpegeldetektor fur das Erkennen des Pegels des 
durch ein Mikrofon eingegebenen Umgebungslarmes, 
eine Steuerung fur das Bestimmen des Spracherken- 
nungspegels gemaft dem erkannten Larmpegel, und ei- 
nen Sprachbefehlserkennungsprozessor fur das Verarbei- 
ten des gesprochenen Sprachbefehls auf der Basis des 
bestimmten Spracherkennungspegels. 
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V^^y Beschreibung 

HENTERGRUND DER ERFTNDUNG 

5 GEBIET DER ERFINDUNG 

Die vorliegende Ertindung bezieht sich auf ein Spracherkennungstelefongerai unci insbesondere aut'eine Spracherken- 
nungsvorrichtung unci cin dafiir verwendetes Steuerverfahren durch das Einstellen des Referenzspraeherkennungspegels 
in Abhangigkeit vein Umgebungslarm. wenn dor oralo eingegebene (naehfolgend als "gesprochen" bezeichnet) Spraeh- 
io befehl i uit deni regis! ricrten Sprachbefehl verg lichen wird. 

BESCHRErBUNG DES STANDIiS DER TECHNIK 

Im aligemeinen ist das Spracherkennungstelefon ein Telefon, das Funktionen durchfuhren kann, wie Lauthoren und 
is ein Abspielen der automatischen Ant wort nachrichl in Hrwiderung auf den gesprochenen Befehl des Benutzers. 

Die Funktionsweise des konventionellen Spraeherkennungstelefons wird naehfolgend beschrieben. Als erstes geht fur 
den anfanglichen RegistrierprozeB des Re fe re nzsprach befehls, wenn erkannr wird. daB die Funktionstaste und die Ein- 
stelltaste durch den Benutzer gedruckt. werden. die Spracherkennungseinheit in die Sprachbefehlsaufzeichnungsbetriebs- 
art, wobei, wenn Sprachbefchie durch das exieme Mikrofon eingegeben werden und danach die Beendigungstaste ge- 
20 driickt wird. die eingegebenen Sprachbefchie in digitale Daten uingewandelt werden. so daB sic aufgezeichnet/registriert 
werden. Wenn die Aufzeichnung solcher Sprachbefchie beender ist, werden die aufgezeichneten Sprachbefehle abge- 
spieli, urn durch den Benutzer best.at.igt zu werden. Beispielsweise stetlt sich das A ufzeichnungs verfahren eines Sprach- 
befehls, der das Abspielen des automatischen Anrufbeantworiers bewirkt, wie folgt dar: Drucken des Sprachbefehlsauf- 
zeichnungsknopfes unter den Funklionsiasten Drucken des Einstetlknopfes — Drucken des beabsichtigten Funk- 
25 tionsknopfes (das ist der Abspielknopf) — Sprechen des Wortes "Abspielen" in das Mikrofon — - Drucken des Beendi- 
gungsknopfes "#". 

Um das Verfahren des Durchluhrens des gesprochenen Befehls zu beschreiben, wenn der gesprochene Befehl durch 
den Benutzer eingegeben wird. wird dieser niir dem aufgezeichneten/registrierten Sprachbefehl verglichen, wobei der 
gesprochene Befehl durchgefiihrt wird. wenn beide gleieh sind. Die Identitat des gesprochenen Befehls ruit dem regi- 

M) strierten Sprachbefehl wird beurteik durch Vergleichen von Sprachkennzeichen. basierend auf verschiedenen Frequen- 
zen in Abhangigkeit von der Lautstiirke und dem Ton. 

Wenn beispielsweise der Benutzer "Abspielen" in das Mikrofon spricht, werden der gesprochene Befehl "Abspielen" 
und die registrierte Sprache "Abspielen" miteinander im Hinblick auf Sprachkennzeichen verglichen. und wenn es sich 
erweist. da6 beide identisch sind. so wird die automatische Antwortvorrichtung gestarter, um aufgezeichncte Nachrich- 

;>5 ten abzuspielen. wohingegen wenn beide nicht identisch sind. der gesprochene Befehl "Abspielen" ignoriert wird. 

Der Spracherkennungspegel. der als Referenz fur das Beurteilen von Sprachkennzeichen verwendet wird, ist vorein- 
gestellt. Wenn beispielsweise der Spracherkennungspegel auf 70% eingestellt wird. so wird der gesprochene Befehl. 
wenn er zu 70% oder inehr init dem regi strierten Befehl identisch ist. akzeptiert. Wie oben erwahnt. muB im Fallc eines 
hdheren Spracherkennungspegels der gesprochene Befehl cine groBere Identitat init dem registrierten Befehl haben, um 

40 akzeptiert zu werden, wohingegen im Fallc eines niedrigeren Spracherkennungspegels der gesprochene Befehl trot./, sei- 
ner niedrigcrercn Identitat mil dem registrierten Sprachbefehl akzeptiert werden kann. 

Das heiBt. wenn der Spracherkennungspegel holier ist. so kann der gesprochene Befehl korrekt ausgefiihrt werden. 
aber die Erkennungsrare ist ge ringer, und im Gegensatz dazu ist, wenn der Spracherkennungspegel niedriger ist. die Er- 
kennungsrate hohcr. aber es werden Fehlfunktionen verursacht. 

45 Das kon vend one lie Sprachcrkennungs tele fori, wie es oben erwahnt. wurde, hat den Nachteil, daB die Spracherken- 
nungsrate eines gesprochenen Befehls niedriger wird durch die Larmmischung im Fallc eines niedrigeren Signal- 
Rausch-(S/N)-Verhaltnisses. wenn der Benutzer den antanglichen Sprachbefehl als Referenzspracherkennungspegel re- 
gistrien. Weiterhin wird im Fallc eines niedrigeren S/N-Verhaltnisses des tatsachlich gesprochenen Befehls die Spraeh- 
erkennungsrate niedrig. obwohl der Referenzspracherkennungspegel antanglich mil einem hoheren S/N-Verhaltnis auf- 

50 gezeichnet wurde. 

ZUS A MME Nl : A S S U NG DER ERFINDUNG 

Somit besteht eine Aufgabe der vorliegenden Ertindung darin. cine Spracherkennungsvorrichtung zu liefern, die den 
55 Spracherkennungspegel in Abhangigkeit votn Larrnpegel, der mil einem gesprochenen Befehl gemischt ist. einstellen 
kann. um die Spracherkennungsrate zu vcrbesscrn. 

Eine andere Aufgabe der vorliegenden Ertindung besteht darin. ein Verfahren fiir das Steuern des Spracherkennungs- 
pegels in Abhangigkeit voni Larrnpegel. der mit einem gesprochenen Befehl gemischt ist. zu steuern, um die Spracher- 
kennungsrate zu vcrbesscrn. 

6o GemaB der vorliegenden Erfindung umfaBt eine Vorrichtung fiir das Steuern des Spracherkennungspegels eines 
Spracherkennungstelefongerates in Abhangigkeit vom Umgebungsgerauschen einen Tonspeicher fur das Aufzeichnen 
der Sprachbefchie, einen Lafmpegeldetektor fiir das Erkennen des Pcgels des Umgebungslanns, der durch das Mikrofon 
eingegeben wird, eine Steuerung fur das Beslimnien des Spracherkennungspegels gemaB deni erkannten Lannpegel. und 
einen Sprachbefehlserkennungsprozessor fiir das Verarbeiten einen gesprochenen Sprachbefehls auf der Basis des be- 

65 stimmten Spracherkennungspegels. 
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7Ji BIiSCTTRIilBUNG DHR ZKrCHmJNGlif^^ 

^ Fig. I ist ein Blockdiagranun, das ein Spracherkennungsrelet'ongerat gemaB cincr Ausfuhrungsform tier vorlieaenden 
Hrfindung zeigt; und " " w ' 

Fig. 2 ist cin FluBdiagramm. das das Verfahrcn des Sicucms des Spracherkennungspegels gemaB eincr Ausfuhrunas- 5 
tbnn der vorliegenden Hrfindung zeigt. " & 

DETAnjJIiRTIi BHSCHRLIBUNG DER BHVORZUGTLN AUSI-tJHRUNGSFORM 

Die Konfiguraiion cines Spraeherkennungstelefongerates gemaB einer Ausfiihrunestbrm der vorlieaenden Krfindunc 10 
wird nachtolgend untcr Bezug auf Fig. 1 beschricben. Die Steuerung 10 steuerr den gesamten Betrieb des Spracherken- 
nungstelefongerars mittels des im Spcicher 34 gespeicherten Steuerprogramms. DerSprechkreis 14 bildet eine Schniit- 
stelle verschiedener Tonsignale. Sprachsignale. etc. unrer der Srcuerung der Sieuerung 10. Das Gabelrelais H/S bildet 
odcr unterbricht mechanisch den Sprachkanal zwischen dem Sprechkreis 14 und der Telcrbnleirung, wenn der Handap- 
parat abgehoben wird. Das Sprechrelais bilder oder unterbricht den Sprachkanal zwischen deni Sprechkreis 14 und der 15 
Telefonleirung unter der Steuerung der Sieuerung 10. Das Mikrotbn 16 wandelt das Sprachsignal in ein elektrisches Si- 
gnal, und der Lautsprecher 18 wandelr das elektrische Signal in ein TonsignaL urn einen horbaren Ton zu erzeueen. Der 
Lautesignaldetektor34ist tnitder Teletbnleitung verbunden. die zum Gabelrelais HAS tuhrt. umsomit das Lautesignal zu 
erkennen, das durch die Telefonleitung eniptangen wird. um es weiier an die Steuerung 10 zu geben. 

Die ersten und zvveiten CODHCs 20. 22 wandeln das analoge (Ton-) Signal in ein digit ales signal und umgekerm. Der 20 
Sprachbctehlserkennungsprozessor 24 verarbeitet den digitalisierten Sprachbetehl, der von den ersten und zweir.cn 
CODEGs 20, 22 empfangen wird, und zeichnet das sich ergebende Signal im Tonspeicher 26 auf. oder er crkennt den 
Lingabesprachbefehl auf der Basis des Spracherkennungspegels, der von der Steuerung 10 geliefert wird. Wcnn der Ein- 
gabesprachbefehl mit dem regisrrienen Sprachbetehl. der im Tonspeicher 26 gespeichen ist. identifiziert wird, so uber- 
fiihrt der obige Sprachbefehlserkennungsprozessor 24 Daten. die die Ausfuhrung des Lingabesprachbefehls bew irken, an -'5 
die Steuerung 10. 

Der Lannpegeldetektor 28 besteht aus einem DC-Gleichrichter (Gleichstromgleichrichter) 30 und einem A/D- Wand- 
ler 32, 11111 somil das Pegetsignal als nunierische Daten geniaB dem Tonsignalpegel, der vom externen Mikrofon 16 ein- 
gegeben wird. zu erzeugen. Der DC-Gleichrichter 30 wandelt das analoge Tonsignal. das vom Mikrofon 16 an^elest 
wird, in ein DC-Signal (Gleichstromsignal). Der A/D-Wandler 32 wandeUden SignalpegeL basierend auf der GroBe des no 
DC-Signals, das durch den DC-Gleichrichter 30 angelegt wird. in ein digitales Signal in Form numerischer Daten. urn so 
das Pegelsignal auszugeben. Gewohnlichcrweise wird der A/D Wandler. der in der Steuerung vorgesehen ist. verwender, 
oder cs kann ein getrennter A/D- Wandler zusatzlich vorgesehen werden. Der Speicher 36 speicherr Steuerproeramme 
und Daten. die vom Betrieb des Telefongerats herruhren. Das Tasteneingabefeld 38 erzeugi 'fasten be fe hie und Tastenda- 
ten fur das Sreuern des Betriebs des Telefongerats. Das Anzeigetensrer 40 zeigr die aktuefien Becriebszustande des Tele- 35 
tons unter der Steuerung der Steuerung 10 an. 

Nachtolgend wird der Betrieb eines Spraeherkennungstelefongerates gemaB einer Austuhrunastbrm der vorlieizenden 
Hrftndung im Detail unter Bezug auf Fig, I erlauiert. Als erstes geht fur das anfanglichc Regisirierveriuhren des Rcfe- 
rcnzsprachbefehls. wenn erkannt wurde, daB die Funktionsfaste und die Linstelltaste durch den Benutzer in der Wane - 
stellung gedriicki wurden. der Sprachbelehlserkennungsprozessor 24 in die Sprachbefehisaufzeichnunesbetriebsart uber. 40 
wobei der durch den Benutzer eingegebene Rcferenzsprachbefehl zum ersten CODEC 20 geliefert wird. der den obi<ien 
analogen Sprachbetehl in einen digitalen Sprachbetehl umwandelt. uni daraufhin den digitalisierten Sprachbetehl an den 
Sprachbctehlserkennungsprozessor 24 zu iiefern. Und wenn der Benutzer den Beendigungsknopf auf dem Tasteneinga- 
befeld 38 druckt. speichen der Sprachbetehlserkennimgsprozessor 24 einen soichen digitalisierten Sprachbetehl im Ton- 
speicher 26 unter der Steuerung der Steuerung 10. *" 45 

Unter Bezug auf Fig. 2 wird der Betrieb des Spracherkennungstelefongerats in lirwiderung auf die Antbrderune fur 
das Austuhren des durch den Benutzer eingegebenen Sprachbefehls nachtolgend beschricben. Als erstes wird dasVer- 
tahren des Erkennens des Larmpegels in den Schritten 214-220 beschrieben. Wenn in Schritt 214 ein speziriziertes Zeit- 
intervall vergangen ist. so geht die Steuerung 10 zu Schritt 216. Die Prutung des Ablauts eines spezifizierten Zeitinter- 
valls (gewohnlichcrweise einige Millisekunden; dient dazu. das Lar m pegelerkennunss verfahrcn periodisch in soichen 50 
Zeitmtervallen durchzufuhrexi. In Schritt 216 erkennr die Steuerung 10 den Signalpegel basierend auf der GroBe des 
Larnis. der vom Mikrofon 16 eingegeben wird. 

Wie beim Larmpegelerkennungsverfahren wird das vom Mikrofon 16 eingegebene Larmsignal an den DC-Gleichrich- 
ter 30 gegeben, wobei die Direktsiromkomponente eliminiert wird, und das^sich ergebende Larinsisnal ohne Gleich- 
stromkomponente an den A/D-Wandler 32 geliefert wird ? wodurch es in binare Zifferndaten umgewandelr wird. die aus 55 
einer spezifizierten Zahl von Bits bestehen. die Larnipegel entsprechen, um dann weiter zur Steuerung 10 ubertraaen zu 
werden. Die Zahl der Bits, die die obigen Larnipegel darstellr, wird durch die Zahl der Sruten der Spracherkennunsspe- 
gel bestimmt. Beispielsweise kbnnen. wenn die Spracherkennungspegel in vier Stufen klassiliziert sind, die Sprachpeael 
durch binare Zifferndaten von zwei Bits dargesiellt werden. Wie oben beschrieben wurde, sent, wenn der Larnipegenn 
Schritt 216 erkannt wird. die Steuerung 10 zu Schritt 218 weiter. um ein solches Larmsignal im Speicher 36 oder einem 60 
internen Hiltspuffer zu speichern, 

Nach dem Speichem eines soichen erkannten Lannpegelsignals, geht die Steuerung 10 zu Schritt 220 weiter. um dem 
Sprachbefehiserkennungsprozessor 24 den relevantcn Spracherkennungspegel. der dem so erkannten Larnipegel em- 
spncht, mittels einer Lanupegelsrufentabelle. die tm Speicher 36 aufgezeichnet ist. mitzuteilen. Wenn die Steuerung 10 
beispielsweise binare Zifferndaten "01" vom Lannpegeldetektor 28 empfangt. so liefert sie den Spracherkennungspeeel 65 
der zweiien Stute, wie das in der folgenden Tabelle 1 aufgelislet ist. amden Sprachbetehlserkennungsprozessor 24. Ein 
Beispiel der Spracherkennungspegel gemaB den Larmpegeln ist in der folgenden Tabelle I aufgelistet. 
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1. Stufe Zustand wie anfanglich registriert 

2 . Stufe Gesprach moglich 

3 . Stufe Gesprach ungiinstig 

4 Stufe Spracherkennung unmoglicti 

w i rd - , « i u f i,i vr,,,. ^nr^libefchlserkennunasprozessor 24 zu beschreiben. wird 

U,n das Verfahrcn dor Ausgabe des Sprachbetehls ^^^g^^^ um in e in digiialcs Signal u.nge- 
der vom Mikrofon 16 eingegebene Sprachbctehl 7,n^ ^ ^ ^ ^ ^ Sprach . 

wandeh zu werden. Dann w.rd dcr vom ersten CODl .C 20 'f^**^?^ Spr achbetehl nut den. Spracherken- 
befehlserkennungspro-^sor 24 angeleg.. der dann e.nen »oUm d«. a J^,^^,, 220 veralcicht . Daein so lches 
nunespesel. der von der S.euerung 10 en.ptangen w,rd. "^^"'^^^^enen) Sprachbetehls mit dc.n regi- 
Spr^chbe-fehlserkennungsverfahren durch Vcrgle.chcn des ongeg ^^^^ £ rslellt . wird hier ke inc de- 
stricrten Sprachbefehl cine konvenuonelle led in,k J en n ™£ ' iier Spracherkennungspeget der zwei.en 

.aillier.e Beschreibung gegeben. Zusa numcnlasse* kann n an c ^ eingestell, wird. so prut', der 

S.ufe. auf den durch die S.eucrung 10 Bezug K esprochenen und des gespeichcrten Spraeh- 

Sptachbefehlserkcnnungsprozessor 24. ob s.eh d e SprachUnr^.cte^« P re „ is , ri crten Sprachbefchle iden.isch 
be'fehls ,u 80% oder mehr ahneln. Wenn enmuelt ^f^^^S^m die S.euerung 10. 
sind. so liefer, der Spraehbefehlscrk^nungspro^ 7U Schrill 222. um 

Daraufhin geht die S.euerung 10. wenn s.e den Spraeterkenn^ P - Beendigung der 

soichen Sprac herkennungsbe^ nach der aus— enden ^ ^ ^ ngefordcrte Funktl0 n 

^ 222 und 224 da sic aufciner konvent,one,ten 

Technik beruhen. vn rlieoende Vrfinduno den Vorteil. daB der Spracherkennungspegel un.er Be- 

jassgSM^%s^*3» &~ - — *■ ra ** - - """" 

mieren und somit die Spracherkennungsrate /u verbessern. 

Patentanspruehe 

1 . Vorncluung zur S.euerung des Spracherkennungspegel* e.nes Spraeherkennungs.elefongera.es in Abhangigkei, 

vom Uniaebungslann, umtassend: 

, S^SSS^S^herken^W^ ™ Abhangigkei, vom U.ngebungs.am. nach Anspruch 

e^n <* das Hi.nun.eren der Cueichs.ro.nkon.ponen.e aus den, U.n- 

SrS'^Hal-Wandler fur das U.nwandein des Un.gebungslanns ohne die G.eichs.ron.kon.ponen.e in bi, 

s niire Ziffemdaten. die den. Lam.pegel emsprcchen. >; ml ne°elderektor fur das Erkennen des Pegels 

3. Verfahrcn in einen, Spracherkennungs.eletongcra.. das ^ P ^'^ verarbeiten eines eesprochenen 

des U.ngcbungslanns und einen Sprachbe.chlserkennun^^or ^ n ^^ Mmn ^ spegeh m 

sprichi. ... . t x rnirif ,ai-'lHp'iekror fur das Erkennen des Pegels 

4 Verfahrcn in #*m S F ache*ennun S »,clc,o„g„,,. eineJ «, pr0 chcr„» 

vorubergehendes Speichem des erkann.cn LSrmpegels: und 



BNSDOCID: <DE_19751536A1_I_> 



• 



* DE 197 51 536 A i 




Versorgen <ies SprachbefchlscrlCcnnungsprozessors mir dcm Spracherkennungspegt^icr dem erkanntcn Lannpegel 
cntsprichl. 
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